문서의 임의 삭제는 제재 대상으로, 문서를 삭제하려면 삭제 토론을 진행해야 합니다. 문서 보기문서 삭제토론 자연 언어 처리 (문단 편집) ===== 통계 기반 방법론 ===== 예시/검색 기반 방법론이 발전되어 나온 방법으로 구글번역을 비롯해 대부분의 온라인 서비스가 이 형태로 되어있다. 쉽게 설명하면 언어 A의 문장이 주어졌을때 언어 B중 가장 높은 확률로 나타날 문장을 구하는것이다. 이런 확률을 구하기 위하여 해당 확률을 다시 단어 번역 확률, 구 번역 확률, 어순 조정 확률로 세분화 되여 통계기반 기계학습 방법으로 학습하며 기타 도움이 되는 정보도 임의로 추가할 수 있다. 해당 방법론은 모델을 구현하기만 하면 번역 데이터가 있는 임의의 언어 쌍에 그대로 적용할 수 있다는 장점이 있다. 물론 번역 데이터를 모으는 일은 쉬운 일이 아니며 보통은 1천만 문장 쌍이 있어야 쓸만한(?) 성능이 나온다. 또한 통계기반 모델은 도메인(분야, 예를 들면 뉴스분야, 특허분야, 웹채팅, SMS등등)에 굉장히 의존적이며 뉴스 도메인 데이터로 학습한 모델을 SMS번역에 적용하면 심각한 성능저하가 생긴다. 웹상에 MOSES[* http://www.statmt.org/moses/]와 같은 오픈소스 툴이 있고 유럽언어쪽은 많은 데이터가 있기에 쉽게 돌려볼수 있다.저장 버튼을 클릭하면 당신이 기여한 내용을 CC-BY-NC-SA 2.0 KR으로 배포하고,기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다.이 동의는 철회할 수 없습니다.캡챠저장미리보기